Model Selection

Fine-tuned wav2vec2

# Fine-tuned wav2vec2

Wav2vec2 Large Xlsr 53 Th Speech Emotion Recognition 3c

A Thai speech emotion recognition model fine-tuned from airesearch/wav2vec2-large-xlsr-53-th, supporting anger, happiness, and calm emotion classification

Audio Classification

Wav2vec2 Turkish Gender Classification

A Turkish gender classification model fine-tuned from facebook/wav2vec2-base, trained on the common_voice_17_0 dataset with a test set accuracy of 84.79%

Audio Classification

Wav2vec2 Base ASVSpoof5 TUC N

A voice anti-spoofing detection model fine-tuned based on wav2vec2-base, achieving 88.89% accuracy on the evaluation set

Audio Classification

Violence Detect 44

An audio classification model fine-tuned from facebook/wav2vec2-base-960h for detecting violent sounds

Audio Classification

Wav2vec2 Base Gender Classification

A fine-tuned voice gender classification model based on facebook/wav2vec2-base, achieving 98.92% accuracy on the evaluation set

Audio Classification

Wav2vec2 Audio Emotion Classification

A fine-tuned audio emotion classification model based on facebook/wav2vec2-base for analyzing emotional states in speech

Audio Classification

Wav2vec2 Phenome Based Alffaamharic

A wav2vec2-based speech recognition model, fine-tuned at the phoneme level for Amharic

Speech Recognition

Wav2vec2 Base Down On

A binary audio classification model fine-tuned from facebook/wav2vec2-base, specifically designed to distinguish between the pronunciations of 'down' and 'on'

Audio Classification

Wav2vec2 Base Music Speech Both Classification

An audio classification model fine-tuned based on facebook/wav2vec2-base for distinguishing between music and speech

Audio Classification

Neunit Nihaochangchu V3

An audio classification model fine-tuned based on facebook/wav2vec2-base, trained on the superb dataset with 99.99% accuracy

Audio Classification

Bsc Ai Thesis Torgo Model 1

A speech processing model fine-tuned based on facebook/wav2vec2-base, demonstrating excellent performance on the evaluation set

Speech Recognition

An audio classification model fine-tuned based on facebook/wav2vec2-base for music genre recognition

Audio Classification

Voip Classification

A fine-tuned speech classification model based on facebook/wav2vec2-base for audio folder dataset classification tasks

Audio Classification

Neunit Ks Kangyuan0601

This model is a fine-tuned audio classification model based on facebook/wav2vec2-base on the superb dataset, achieving 99.87% accuracy on the evaluation set.

Audio Classification

An audio classification model fine-tuned on the SUPERB dataset based on facebook/wav2vec2-base, achieving 99.98% accuracy

Audio Classification

Wav2vec2 Base Toronto Emotional Speech Set

An audio emotion classification model fine-tuned based on wav2vec2-base, used to identify the speaker's emotional state.

Audio Classification

Transformers English

A fine-tuned speech emotion recognition model based on facebook/wav2vec2-base, achieving 84.71% accuracy on the evaluation set

Audio Classification

Is Vinyl Scratched Or Not

An audio classification model fine-tuned based on wav2vec2-base, used to detect scratches in vinyl record audio.

Audio Classification

Transformers English

Wav2vec2 Base Finetuned Coscan Age Group

Age group classification model fine-tuned on the COSCAN-speech dataset based on wav2vec2-base, achieving 99.8% accuracy on the validation set

Audio Classification

Exp W2v2t En Vp Nl S281

An English speech recognition model fine-tuned based on facebook/wav2vec2-large-nl-voxpopuli, trained using the Common Voice 7.0 training set.

Speech Recognition

Transformers English

Wav2vec2 Final 1 Lm 4

A speech recognition model fine-tuned based on facebook/wav2vec2-base, achieving a word error rate of 0.4499 on the evaluation set

Speech Recognition

Wav2vec2 Large Xls R 300m Kinyarwanda

A Kinyarwanda speech recognition model fine-tuned on the common_voice dataset based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Ai Light Dance Singing Ft Wav2vec2 Large Lv60 V2

This model is an automatic speech recognition model fine-tuned on the ONSET-SINGING dataset based on wav2vec2-large-lv60, focusing on singing voice recognition tasks.

Speech Recognition

Wav2vec2 Large Xls R 300m Guarani Small Wb

This model is an automatic speech recognition (ASR) model based on the wav2vec2-large-xls-r-300m architecture, fine-tuned on the Guarani speech dataset.

Speech Recognition

Wav2vec2 Large Xls R 300m Turkish Colab

A speech recognition model fine-tuned on the Common Voice Turkish dataset based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Wav2vec2 Base Keyword Spotting

A fine-tuned speech keyword recognition model based on wav2vec2-base on the superb dataset, achieving 98.43% accuracy

Audio Classification

Wav2vec2 Xls R 300m Adult Child Cls

A fine-tuned adult-child voice classification model based on facebook/wav2vec2-xls-r-300m, achieving 94.04% accuracy

Audio Classification

Wav2vec2 Large Xls R 300m My Hindi Home Latest Colab

This model is a fine-tuned version of facebook/wav2vec2-large-xlsr-53 on a general speech dataset, primarily used for speech recognition tasks.

Speech Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase